rank | frequency | n-gram |
---|---|---|
1 | 3995 | -์ |
2 | 3932 | -น |
3 | 2794 | -ง |
4 | 2486 | -า |
5 | 1902 | -ย |
rank | frequency | n-gram |
---|---|---|
1 | 1043 | -ี่ |
2 | 985 | -ร์ |
3 | 942 | -อง |
4 | 718 | -ัน |
5 | 574 | -่า |
rank | frequency | n-gram |
---|---|---|
1 | 934 | -ที่ |
2 | 452 | -ไทย |
3 | 436 | -ว่า |
4 | 365 | -อร์ |
5 | 355 | -ของ |
rank | frequency | n-gram |
---|---|---|
1 | 453 | -นที่ |
2 | 287 | -สตร์ |
3 | 199 | -ชาติ |
4 | 166 | -เป็น |
5 | 133 | -กว่า |
rank | frequency | n-gram |
---|---|---|
1 | 343 | -ันที่ |
2 | 287 | -าสตร์ |
3 | 137 | -งชาติ |
4 | 125 | -ทศไทย |
5 | 112 | -ระมาณ |
The tables show the most frequent letter-N-grams at the ending of words for N=1…5. Everything runs in parallel to 2.2.5 Most frequent word beginnings. The aim is suffix detection instead of affix detection.
For N=3:
SELECT @pos:=(@pos+1), xx.* from (SELECT @pos:=0) r, (select count(*) as cnt ,concat("-", right(word,3)) FROM words WHERE w_id>100 group by right(word,3) order by cnt desc) xx limit 5;
2.2.5 Most frequent word beginnings